545 research outputs found

    LUSA: the HPC library for lattice-based cryptanalysis

    Get PDF
    This paper introduces LUSA - the Lattice Unified Set of Algorithms library - a C++ library that comprises many high performance, parallel implementations of lattice algorithms, with particular focus on lattice-based cryptanalysis. Currently, LUSA offers algorithms for lattice reduction and the SVP. % and the CVP. LUSA was designed to be 1) simple to install and use, 2) have no other dependencies, 3) be designed specifically for lattice-based cryptanalysis, including the majority of the most relevant algorithms in this field and 4) offer efficient, parallel and scalable methods for those algorithms. LUSA explores paralellism mainly at the thread level, being based on OpenMP. However the code is also written to be efficient at the cache and operation level, taking advantage of carefully sorted data structures and data level parallelism. This paper shows that LUSA delivers these promises, by being simple to use while consistently outperforming its counterparts, such as NTL, plll and fplll, and offering scalable, parallel implementations of the most relevant algorithms to date, which are currently not available in other libraries

    Óleo de canola como uma alternativa para a têmpera do aço AISI 8640

    Get PDF
    AISI 8640 is one of the most used steel in the manufacturing industry due its wide range of applicability and properties. The quenching process is commonly applied in parts made of this steel in order to enhance some properties, such as strength and hardness. Petroleum derived oils are the most common quenchants, however this kind of quenchant is considered to be non-biodegradable, toxic to the health and environment, as well as, not renewable. In the present study, canola oil presented the same efficiency than a conventional petroleum derived oil in the quenching process of AISI 8640 steel billets with diameter of 25.4mm.O AISI 8640 é um dos aços mais utilizados na indústria de manufatura devido às suas grandes faixas de aplicabilidade e propriedades. O processo de têmpera é comumente aplicado em peças feitas desse aço com o objetivo de melhorar suas propriedades, como a resistência e a dureza. Óleos derivados de petróleo são os mais comumente utilizados como meio de têmpera, porém esse tipo de óleos é considerado como não biodegradável, tóxico para a saúde e o ambiente, bem como, não renováveis. No presente estudo, o óleo de canola apresentou a mesma eficiência que o óleo convencional derivado de petróleo em um processo de têmpera de tarugos de aço AISI 8640 com diâmetro de 25,4 mm

    A generic and highly efficient parallel variant of Borůvka's algorithm

    Get PDF
    This paper presents (i) a parallel, platformindependent variant of Borůvka's algorithm, an efficient Minimum Spanning Tree (MST) solver, and (ii) a comprehensive comparison of MST-solver implementations, both on multi-core CPU-chips and GPUs. The core of our variant is an effective and explicit contraction of the graph. Our multi-core CPU implementation scales linearly up to 8 threads, whereas the GPU implementation performs considerably better than the optimal number of threads running on the CPU. We also show that our implementations outperform all other parallel MST-solver implementations in (ii), for a broad set of publicly available roadnetwork graphs.info:eu-repo/semantics/publishedVersio

    Heterogeneous implementation of a Voronoi cell-based SVP solver

    Get PDF
    This paper presents a new, heterogeneous CPU+GPU attacks against lattice-based (postquantum) cryptosystems based on the Shortest Vector Problem (SVP), a central problem in lattice-based cryptanalysis. To the best of our knowledge, this is the first SVP-attack against lattice-based cryptosystems using CPUs and GPUs simultaneously. We show that Voronoi-cell based CPU+GPU attacks, algorithmically improved in previous work, are suitable for the proposed massively parallel platforms. Results show that 1) heterogeneous platforms are useful in this scenario, as they increment the overall memory available in the system (as GPU's memory can be used effectively), a typical bottleneck for Voronoi-cell algorithms, and we have also been able to increase the performance of the algorithm on such a platform, by successfully using the GPU as a co-processor, 2) this attack can be successfully accelerated using conventional GPUs and 3) we can take advantage of multiple GPUs to attack lattice-based cryptosystems. Experimental results show a speedup up to 7.6× for 2 GPUs hosted by an Intel Xeon E5-2695 v2 CPU (12 cores ×2 sockets) using only 1 core and gains in the order of 20% for 2 GPUs hosted by the same machine using all 22 CPU threads (2 are reserved for orchestrating the GPUs), compared to single-CPU execution using the entire 24 threads available.This work was supported in part by the Instituto de Telecomunicações, in part by the Fundação para a Ciência e a Tecnologia (FCT) under Grant UID/EEA/50008/2019 and Grant PTDC/EEI-HAC/30485/2017, and in part by the National Funds through the Portuguese Funding Agency, FCT—Fundação para a Ciência e a Tecnologia, under Grant UID/EEA/50014/2019. The work of A. Mariano was supported by the Deutsche Forschungsgemeinschaft (DFG, German Research Foundation) under Grant 382285730

    Cuidando para a criança crescer apesar da dor: a experiência da família

    Get PDF
    This study aimed to understand the meaning of the experience of families having a child experiencing pain due to Juvenile Rheumatoid Arthritis and to construct a theoretical model representing this experience. Grounded Theory and Symbolic Interactionism were used as methodological framework and theoretical framework, respectively. Data were collected by semistructured interviews with 12 families. Data analysis allowed for the construction of the theoretical model Caring for the child to grow despite the pain, which describes an experience based on motivational elements: wanting to see the child without pain and wanting to see the child live a normal life, reviewing how the family lives the transition in its development cycles, retaking and integrating them in the family dynamic with the appearance of the disease and pain in the child. This theoretical model provides a framework for teaching, research and care, permitting advances in terms of theoretical nursing knowledge.Este trabajo tuvo como objetivos comprender el cotidiano de la familia del niño que vivencia la situación de dolor consecuente de la Artritis Reumatoidea Juvenil y construir un modelo teórico representativo de esa experiencia. La Teoría Fundamentada en los Datos y el Interacionismo Simbólico fueron utilizados como referenciales metodológico y teórico, respectivamente. Los datos fueron obtenidos por intermedio de entrevistas semi-estructuradas a 12 familias. El análisis de los datos permitió construir el modelo teórico Cuidando para que el niño crezca a pesar del dolor, que describe una experiencia estructurada en torno a los elementos motivadores: queriendo ver el niño libre del dolor y queriendo ver el niño llevar una vida normal, revelando como la familia vivencia las transiciones en sus ciclos de desarrollo, integrándolos en la dinámica familiar con la llegada de la enfermedad y del dolor en el niño. Este modelo proporciona un referencial que ayuda a la enseñanza, investigación y atención, permitiendo avanzar en el conocimiento teórico en enfermería.Os objetivos desse estudo foram compreender o significado da experiência da família da criança com dor decorrente de artrite reumatóide juvenil e construir um modelo teórico representativo dessa experiência. A Teoria Fundamentada nos Dados e o Interacionismo Simbólico foram utilizados como referencial metodológico e teórico, respectivamente. Foram realizadas 12 entrevistas semi-estruturadas com famílias das crianças. A partir da análise dos dados, emergiu o modelo teórico Cuidando para a criança crescer, apesar da dor, constituído por elementos motivacionais: querendo ver a criança livre da dor e querendo ver a criança levar uma vida normal, além de elementos intervenientes, revelando como a família vivencia as transições em seus ciclos de desenvolvimento, retomando-os e integrando-os na sua dinâmica com a chegada da doença e da dor na criança. Esse modelo teórico proporciona um referencial para as práticas de ensino, pesquisa e assistência, permitindo avançar em termos de conhecimento teórico para a enfermagem

    Progressive lattice sieving

    Get PDF
    Most algorithms for hard lattice problems are based on the principle of rank reduction: to solve a problem in a dd-dimensional lattice, one first solves one or more problem instances in a sublattice of rank d1d - 1, and then uses this information to find a solution to the original problem. Existing lattice sieving methods, however, tackle lattice problems such as the shortest vector problem (SVP) directly, and work with the full-rank lattice from the start. Lattice sieving further seems to benefit less from starting with reduced bases than other methods, and finding an approximate solution almost takes as long as finding an exact solution. These properties currently set sieving apart from other methods. In this work we consider a progressive approach to lattice sieving, where we gradually introduce new basis vectors only when the sieve has stabilized on the previous basis vectors. This leads to improved (heuristic) guarantees on finding approximate shortest vectors, a bigger practical impact of the quality of the basis on the run-time, better memory management, a smoother and more predictable behavior of the algorithm, and significantly faster convergence - compared to traditional approaches, we save between a factor 2020 to 4040 in the time complexity for SVP

    Scheduling (ir)regular applications on heterogeneous platforms

    Get PDF
    Dissertação de mestrado em Engenharia de InformáticaCurrent computational platforms have become continuously more and more heterogeneous and parallel over the last years, as a consequence of incorporating accelerators whose architectures are parallel and different from the CPU. As a result, several frameworks were developed to aid to program these platforms mainly targeting better productivity ratios. In this context, GAMA framework is being developed by the research group involved in this work, targeting both regular and irregular algorithms to efficiently run in heterogeneous platforms. Scheduling is a key issue of GAMA-like frameworks. The state of the art solutions of scheduling on heterogeneous platforms are efficient for regular applications but lack adequate mechanisms for irregular ones. The scheduling of irregular applications is particularly complex due to the unpredictability and the differences on the execution time of their composing computational tasks. This dissertation work comprises the design and validation of a dynamic scheduler’s model and implementation, to simultaneously address regular and irregular algorithms. The devised scheduling mechanism is validated within the GAMA framework, when running relevant scientific algorithms, which include the SAXPY, the Fast Fourier Transform and two n-Body solvers. The proposed mechanism is validated regarding its efficiency in finding good scheduling decisions and the efficiency and scalability of GAMA, when using it. The results show that the model of the devised dynamic scheduler is capable of working in heterogeneous systems with high efficiency and finding good scheduling decisions in the general tested cases. It achieves not only the scheduling decision that represents the real capacity of the devices in the platform, but also enables GAMA to achieve more than 100% of efficiency as defined in [3], when running a relevant scientific irregular algorithm. Under the designed scheduling model, GAMA was also able to beat CPU and GPU efficient libraries of SAXPY, an important scientific algorithm. It was also proved GAMA’s scalability under the devised dynamic scheduler, which properly leveraged the platform computational resources, in trials with one central quad-core CPU-chip and two GPU accelerators.As plataformas computacionais actuais tornaram-se cada vez mais heterogéneas e paralelas nos últimos anos, como consequência de integrarem aceleradores cujas arquitecturas são paralelas e distintas do CPU. Como resultado, várias frameworks foram desenvolvidas para programar estas plataformas, com o objectivo de aumentar os níveis de produtividade de programação. Neste sentido, a framework GAMA está a ser desenvolvida pelo grupo de investigação envolvido nesta tese, tendo como objectivo correr eficientemente algoritmos regulares e irregulares em plataformas heterogéneas. Um aspecto chave no contexto de frameworks congéneres ao GAMA é o escalonamento. As soluções que compõem o estado da arte de escalonamento em plataformas heterogéneas são eficientes para aplicaçóes regulares, mas ineficientes para aplicações irregulares. O escalonamento destas é particularmente complexo devido à imprevisibilidade e ás diferenças no tempo de computação das tarefas computacionais que as compõem. Esta dissertação propõe o design e validação de um modelo de escalonamento e respectiva implementação, que endereça tanto aplicações regulares como irregulares. O mecanismo de escalonamento desenvolvido é validado na framework GAMA, executando algoritmos científicos relevantes, que incluem a SAXPY, a Transformada Rápida de Fourier e dois algoritmos de resolução do problema n-Corpos. O mecanismo proposto é validado quanto à sua eficiência em encontrar boas decisões de escalonamento e quanto à eficiência e escalabilidade do GAMA, quando fazendo uso do mesmo. Os resultados obtidos mostram que o modelo de escalonamento proposto é capaz de executar em plataformas heterogéneas com alto grau de eficiência, uma vez que encontra boas decisões de escalonamento na generalidade dos casos testados. Além de atingir a decisão de escalonamento que melhor representa o real poder computacional dos dispositivos na plataforma, também permite ao GAMA atingir mais de 100% de eficiência tal como definida em [3], executando um importante algoritmo científico irregular. Integrando o modelo de escalonamento desenvolvido, o GAMA superou ainda bibliotecas eficientes para CPU e GPU na execução do SAXPY, um importante algoritmo científico. Foi também provada a escalabilidade do GAMA sob o modelo desenvolvido, que aproveitou da melhor forma os recursos computacionais disponíveis, em testes para um CPU-chip de 4 núcleos e dois GPUs

    Parallel improved Schnorr-Euchner enumeration SE++ on shared and distributed memory systems, with and without extreme pruning

    Get PDF
    The security of lattice-based cryptography relies on the hardness of problems based on lattices, such as the Shortest Vector Problem (SVP) and the Closest Vector Problem (CVP). This paper presents two parallel implementations for the SE++ with and without extreme pruning. The SE++ is an enumeration-based CVP-solver, which can be easily adapted to solve the SVP. We improved the SVP version of the SE++ with an optimization that avoids symmetric branches, improving its performance by a factor of ≈ 50%, and applied the extreme pruning technique to this improved version. The extreme pruning technique is the fastest way to compute the SVP with enumeration known to date. It solves the SVP for lattices in much higher dimensions in less time than implementations without extreme pruning. Our parallel implementation of the SE++ with extreme pruning targets distributed memory multi-core CPU systems, while our SE++ without extreme pruning is designed for shared memory multi-core CPU systems. These implementations address load balancing problems for optimal performance, with a master-slave mechanism on the distributed memory implementation, and specific bounds for task creation on the shared memory implementation. The parallel implementation for the SE++ without extreme pruning scales linearly for up to 8 threads and almost linearly for 16 threads. In addition, it also achieves super-linear speedups on some instances, as the workload may be shortened, since some threads may find shorter vectors at earlier points in time, compared to the sequential implementation. Tests with our Improved SE++ implementation showed that it outperforms the state of the art implementation by a factor of between 35% and 60%, while maintaining a scalability similar to the SE++ implementation. Our parallel implementation of the SE++ with extreme pruning achieves linear speedups for up to 8 (working) processes and speedups of up to 13x for 16 (working) processes(undefined)info:eu-repo/semantics/publishedVersio

    Paralelização de algoritmos de enumeração para o problema do vector mais curto em sistemas de memória partilhada e distribuída

    Get PDF
    A criptografia baseada em retículos tem vindo a tornar-se um tópico central ao longo da última década, uma vez que se acredita que este tipo de criptografia seja resistente a ataques infligidos com computadores quânticos. A segurança desta criptografia é medida pela eficácia e praticabilidade dos algoritmos que resolvem problemas centrais em retículos, como o problema do vector mais curto (PVC), e é, por isso, importante determinar qual o desempenho máximo destes algoritmos em arquitecturas computacionais de alto rendimento. Neste sentido, este artigo apresenta, pela primeira vez, um estudo detalhado sobre o desempenho dos dois mais promissores algoritmos de resolução do PVC, o ENUM e uma variante eficiente da enumeração de Schnorr-Euchner, com e sem poda extrema. Em particular, são propostas versões paralelas destes algoritmos, desenvolvidas para óptimo balanço de carga e, consequentemente, melhor desempenho. Conduziu-se uma extensa série de testes, quer em memória partilhada, para as variantes sem poda, quer em memória distribuída, para as variantes com poda. Os resultados mostram que as implementações em memória partilhada atingem, em certos casos, acelerações lineares até 16 \textit{threads}. As implementações em memória distribuída, por seu turno, são aceleradas em cerca de 13 vezes para 16 processos, permitindo a resolução do PVC em retículos em dimensão 80 em menos de 250 segundos.Fundação para a Ciência e a Tecnologia (FCT

    A prevenção e o combate às ameaças híbridas: impacto para as Forças Armadas Portuguesas

    Get PDF
    Nos últimos anos, com a contenção das guerras interestatais convencionais, a emergência de novas ameaças transnacionais e a informatização da vida moderna têm conduzido a sociedade a um diferente paradigma civilizacional, onde as ameaças híbridas surgem como um dos principais desafios securitários e militares, que exige uma resposta cooperativa e integrada de toda a sociedade. Neste contexto, o objetivo desta investigação consiste em propor linhas de ação para o combate às ameaças híbridas, ao nível das Forças Armadas Portuguesas e encontra-se alicerçado em três objetivos específicos, que passam por analisar: o papel do Instrumento de Poder Militar; as linhas de orientação Estratégicas da União Europeia e da Organização do Tratado do Atlântico Norte; e as capacidades das Forças Armadas para o combate às ameaças híbridas. Adotou-se uma investigação baseada num raciocínio indutivo, apoiada numa estratégia de investigação qualitativa e num desenho de pesquisa de estudo de caso. Como técnicas de recolha de dados, recorreu-se à análise documental e a entrevistas semiestruturadas. Como principais resultados, releva-se a proposta de doze linhas de ação que visam constituir-se como os elementos orientadores para o processo de alinhamento de uma estratégia futura, e um contributo para a clareza conceptual e compreensão das ameaças híbridas.Over the past years, the containment of interstate conventional wars, the emergence of transnational threats, the interconnectivity and computerization of modern life have led to a civilizational paradigm shift where the hybrid threats have emerged as one of the main security and military challenges, which requires a cooperative and integrated response from the whole society. In this context, the aim of this research, is to propose courses of action to counter hybrid threats, at the level of the Portuguese Armed Forces, and it is based on three specific objectives, that go through analyzing; the role of the Military Power, the European Union and the North Atlantic Treaty Organization strategic guidelines, and the capabilities of the Armed Forces to combat hybrid threats. The research, based on inductive reasoning, lays on a qualitative research strategy and a case study design. Data collection techniques include extensive document analysis and semi-structured interviews. The major results are the significant contributions toward the conceptual clarity and the understanding of the hybrid threats, underlining the identification of twelve Courses of Action which are intended to be perceived as guiding elements in the pursue of a future aligned strategyN/
    corecore